Premières initiatives :
En français :
Hypertext Markup Language
Exercice Ouvrez un éditeur de texte (par exemple le bloc note) et entrez (ou collez…) le fragment de code précédent. Ouvrez-le dans votre navigateur et contemplez.
Vous pouvez y faire des modifications, ajouter des éléments, changer la cible du lien. La documentation MDN est souvent d’un grand secours.
< et > sont des balises (tags, elements)C’est une convention historique d’annotation, recyclée
Extensible Markup Language
<div type="act" n="II" xml:id="II"><head>Acte II</head>
<div type="scene" n="2" xml:id="II2"><head>Scène 2</head>
<sp><speaker>Rodrigue</speaker>
<l part="I">À moi, comte, deux mots.</l></sp>
<sp><speaker>Comte</speaker>
<l part="M">Parle</l></sp>
<sp><speaker>Rodrique</speaker>
<l part="F">Ôte-moi d'un doute</l></sp>
<sp><speaker>Comte</speaker>
<l part="I">Connais-tu bien Don Diègue ?</l></sp>
<sp><speaker>Comte</speaker>
<l part="M">Oui</l></sp>
<sp><speaker>Rodrigue</speaker>
<l part="F">Parlons bas, écoute.</l>
<l>Sais-tu que ce vieillard fut la même vertu,</l>
<l>La vaillance et l'honneur de son temps ? Le sais-tu ?</l></sp>
</div>
</div>La « Text Encoding Initiative » (TEI) est l’un des projets les plus durables et influents du champ aujourd’hui appelé « humanités numériques ». Son but est de fournir des recommandations pour la création et la gestion sous forme numérique de tout type de données créées et utilisées par les chercheurs en sciences humaines, comme les sources historiques, les manuscrits, les documents d’archives, les inscriptions anciennes et bien d’autres.
(Burnard, 2015)
La TEI met l’accent sur ce qui est partagé par tous les types de documents, qu’ils soient représentés physiquement sous une forme numérique sur un disque ou une carte mémoire, sous une forme imprimée comme un livre ou un journal, sous une forme écrite comme un manuscrit ou un codex, ou sous une forme inscrite dans la pierre ou sur une tablette de cire.
Cette continuité facilite la migration du texte depuis des manifestations plus anciennes, comme l’imprimé ou le manuscrit, vers d’autres plus récentes comme le disque ou l’écran.
C’est pourquoi la vision de la TEI de ce qu’est le texte est largement conditionnée par ce que le texte a été dans le passé, sans toutefois trop compromettre ce que le texte peut devenir dans le futur. Elle essaie de traiter tous les types de documents numériques de la même façon, qu’ils soient « nativement numériques » ou non.
La TEI fournit le nom et la définition de centaines de balises, en même temps que des règles sur la façon dont elles peuvent être combinées. Plus précisément, les Guidelines de la TEI définissent cinq ou six cents concepts différents, avec les spécifications détaillées des éléments et classes d’éléments XML qui peuvent être utilisés pour les représenter.
Lou Burnard. 2015. Qu’est-ce que la Text Encoding Initiative ?Encyclopédie numérique. OpenEdition Press, Marseille, éditions, octobre.